智能论文笔记

Purifier: Defending Data Inference Attacks via Transforming Confidence Scores

Ziqi Yang , Lijin Wang , Da Yang , Jie Wan , Ziming Zhao , Ee-Chien Chang , Fan Zhang , Kui Ren

分类：机器学习

2022-12-01

Neural networks are susceptible to data inference attacks such as the membership inference attack, the adversarial model inversion attack and the attribute inference attack, where the attacker could infer useful information such as the membership, the reconstruction or the sensitive attributes of a data sample from the confidence scores predicted by the target classifier. In this paper, we propose a method, namely PURIFIER, to defend against membership inference attacks. It transforms the confidence score vectors predicted by the target classifier and makes purified confidence scores indistinguishable in individual shape, statistical distribution and prediction label between members and non-members. The experimental results show that PURIFIER helps defend membership inference attacks with high effectiveness and efficiency, outperforming previous defense methods, and also incurs negligible utility loss. Besides, our further experiments show that PURIFIER is also effective in defending adversarial model inversion attacks and attribute inference attacks. For example, the inversion error is raised about 4+ times on the Facescrub530 classifier, and the attribute inference accuracy drops significantly when PURIFIER is deployed in our experiment.

translated by 谷歌翻译

Simultaneous Estimation of Hand Configurations and Finger Joint Angles using Forearm Ultrasound

Keshav Bimbraw , Christopher J. Nycz , Matt Schueler , Ziming Zhang , Haichong K. Zhang

分类：机器人 | 计算机视觉

2022-11-29

With the advancement in computing and robotics, it is necessary to develop fluent and intuitive methods for interacting with digital systems, augmented/virtual reality (AR/VR) interfaces, and physical robotic systems. Hand motion recognition is widely used to enable these interactions. Hand configuration classification and MCP joint angle detection is important for a comprehensive reconstruction of hand motion. sEMG and other technologies have been used for the detection of hand motions. Forearm ultrasound images provide a musculoskeletal visualization that can be used to understand hand motion. Recent work has shown that these ultrasound images can be classified using machine learning to estimate discrete hand configurations. Estimating both hand configuration and MCP joint angles based on forearm ultrasound has not been addressed in the literature. In this paper, we propose a CNN based deep learning pipeline for predicting the MCP joint angles. The results for the hand configuration classification were compared by using different machine learning algorithms. SVC with different kernels, MLP, and the proposed CNN have been used to classify the ultrasound images into 11 hand configurations based on activities of daily living. Forearm ultrasound images were acquired from 6 subjects instructed to move their hands according to predefined hand configurations. Motion capture data was acquired to get the finger angles corresponding to the hand movements at different speeds. Average classification accuracy of 82.7% for the proposed CNN and over 80% for SVC for different kernels was observed on a subset of the dataset. An average RMSE of 7.35 degrees was obtained between the predicted and the true MCP joint angles. A low latency (6.25 - 9.1 Hz) pipeline has been proposed for estimating both MCP joint angles and hand configuration aimed at real-time control of human-machine interfaces.

translated by 谷歌翻译

EgoSpeed-Net: Forecasting Speed-Control in Driver Behavior from Egocentric Video Data

Yichen Ding , Ziming Zhang , Yanhua Li , Xun Zhou

分类：计算机视觉 | 机器学习

2022-09-27

速度控制预测是驾驶员行为分析中一个具有挑战性的问题，旨在预测驾驶员在控制车速（例如制动或加速度）中的未来行动。在本文中，我们尝试仅使用以自我为中心的视频数据来应对这一挑战，与使用第三人称视图数据或额外的车辆传感器数据（例如GPS或两者）的文献中的大多数作品相比。为此，我们提出了一个基于新型的图形卷积网络（GCN）网络，即Egospeed-net。我们的动机是，随着时间的推移，对象的位置变化可以为我们提供非常有用的线索，以预测未来的速度变化。我们首先使用完全连接的图形图将每个类的对象之间的空间关系建模，并在其上应用GCN进行特征提取。然后，我们利用一个长期的短期内存网络将每个类别的此类特征随着时间的流逝融合到矢量中，加入此类矢量并使用多层perceptron分类器预测速度控制动作。我们在本田研究所驾驶数据集上进行了广泛的实验，并证明了Egospeed-NET的出色性能。

translated by 谷歌翻译

Improving RGB-D Point Cloud Registration by Learning Multi-scale Local Linear Transformation

Ziming Wang , Xiaoliang Huo , Zhenghao Chen , Jing Zhang , Lu Sheng , Dong Xu

分类：计算机视觉

2022-08-31

点云注册旨在估计两点云扫描之间的几何变换，在该点对应的估计中是其成功的关键。除了先前通过手工制作或学习的几何特征寻求对应的方法外，最近的点云注册方法还尝试应用RGB-D数据以实现更准确的对应关系。但是，有效地融合了这两种独特方式的几何和视觉信息并不是微不足道的，尤其是对于注册问题而言。在这项工作中，我们提出了一种新的几何感知视觉特征提取器（给出），该提取器采用多尺度的本地线性转换来逐步融合这两种方式，其中深度数据的几何特征是几何依赖于几何依赖的卷积内核来转换RGB数据的视觉功能。最终的视觉几何特征位于典型的特征空间中，由于几何变化引起的视觉差异可缓解，因此可以实现更可靠的对应关系。提出的给出的模块可以很容易地插入最近的RGB-D点云注册框架中。在3D匹配和扫描仪上进行的广泛实验表明，即使没有信件或姿势监督，我们的方法即使在没有通信或姿势的情况下也优于最先进的点云注册方法。该代码可在以下网址获得：https：//github.com/514DNA/llt。

translated by 谷歌翻译

Fed-FSNet: Mitigating Non-I.I.D. Federated Learning via Fuzzy Synthesizing Network

Jingcai Guo , Song Guo , Jie Zhang , Ziming Liu

分类：计算机视觉 | 机器学习

2022-08-21

联合学习（FL）最近成为一个有希望的保护分布式机器学习框架。它旨在通过在边缘设备上进行本地进行分布式培训，并将本地模型汇总到一个全球模型中，而无需在云服务器中进行集中式的原始数据共享，以协作学习共享的全局模型。但是，由于跨越边缘设备的局部数据异质性较大（非I.I.D.数据），因此FL可能会轻松获得一个全球模型，该模型可以在本地数据集中产生更多移动的梯度，从而降低模型性能，甚至遭受非连接性的影响在训练中。在本文中，我们提出了一个新颖的FL训练框架，使用适当设计的模糊合成网络（FSNET）来减轻非I.I.I.D。 fl源。具体而言，我们在云服务器中维护一个边缘无形的隐藏模型，以估计全局模型的方向意识反转时，估计了不正确的模型。然后，隐藏的模型可以模糊地合成几个模拟I.I.D.数据示例（示例特征）仅在全局模型上进行条件，边缘设备可以共享，以促进FL训练，以更快，更好的收敛性。此外，由于合成过程既不涉及对本地模型的参数/更新的访问，也不涉及分析各个本地模型输出，因此我们的框架仍然可以确保FL的隐私。几个FL基准的实验结果表明，我们的方法可以显着减轻非I.I.D。发行并获得其他代表性方法的更好绩效。

translated by 谷歌翻译

Seeing your sleep stage: cross-modal distillation from EEG to infrared video

Jianan Han , Shaoxing Zhang , Aidong Men , Yang Liu , Ziming Yao , Yan Yan , Qingchao Chen

分类：计算机视觉 | 人工智能

2022-08-11

对于诊断各种疾病的诊断，对睡眠阶段进行分类至关重要。但是，现有的自动诊断方法主要采用“金标准”局部脑图（EEG）或医院中多摄像机仪（PSG）机器的其他单型模式传感信号，这些信号昂贵，导入且因此不适合保健点监测在家。为了在家中启用睡眠阶段监控，我们在本文中分析了红外视频与脑电图信号之间的关系，并提出了一项新任务：通过将有用的知识从EEG信号提炼到视觉视频，使用红外视频对睡眠阶段进行分类。为了为该应用程序建立可靠的跨模式基准，我们开发了一个新的数据集，称为通过红外视频和脑电图（$ s^3ve $）看到您的睡眠阶段。 $ s^3ve $是一个大型数据集，包括用于睡眠阶段分类的同步红外视频和脑电图信号，包括105个主题和154,573个视频剪辑，长度超过1100小时。我们的贡献不仅限于数据集，而且还涉及一种新型的跨模式蒸馏基线模型，即结构感知的对比度蒸馏（SACD），以将脑电图知识提升为红外视频特征。 SACD在我们的$ S^3ve $和现有的跨模式蒸馏基准上都达到了最先进的表演。基准方法和基线方法都将被释放给社区。我们希望在睡眠阶段分类中提高更多注意力并促进更多的发展，更重要的是，从临床信号/媒体到传统媒体的跨模式蒸馏。

translated by 谷歌翻译

Robust Object Detection With Inaccurate Bounding Boxes

Chengxin Liu , Kewei Wang , Hao Lu , Zhiguo Cao , Ziming Zhang

分类：计算机视觉

2022-07-20

学习准确的对象探测器通常需要具有精确对象边界框的大规模培训数据。但是，标记此类数据是昂贵且耗时的。随着众包标签过程和对象的歧义可能会引起嘈杂的边界盒注释，对象探测器将遭受退化的训练数据。在这项工作中，我们旨在应对使用不准确的边界框来学习健壮对象探测器的挑战。受到以下事实的启发：本地化精度在分类精度不准确的框中显着遭受不准确的框架的影响，我们建议将分类作为用于完善定位结果的指导信号。具体而言，通过将对象视为一袋实例，我们引入了一种对象感知的多个实例学习方法（OA-MIL），其中具有对象感知的实例选择和对象感知实例扩展。前者旨在选择准确的培训实例，而不是直接使用不准确的框注释。后者的重点是生成高质量的选择实例。关于合成嘈杂数据集的广泛实验（即嘈杂的Pascal VOC和MS-Coco）和真正的嘈杂小麦头数据集证明了我们OA-MIL的有效性。代码可从https://github.com/cxliu0/oa-mil获得。

translated by 谷歌翻译

Auto-Encoding Adversarial Imitation Learning

Kaifeng Zhang , Rui Zhao , Ziming Zhang , Yang Gao

分类：机器学习

2022-06-22

加强学习（RL）为决策提供了一个强大的框架，但是其实践中的应用通常需要精心设计的奖励功能。对抗性模仿学习（AIL）阐明了自动策略获取，而无需从环境中访问奖励信号。在这项工作中，我们提出了自动编码的对抗模仿学习（AEAIL），这是一个强大而可扩展的AIL框架。为了从演示中诱导专家政策，AEAIL利用自动编码器的重建误差作为奖励信号，该奖励信号比以前的基于歧视者提供了更多的优化策略信息。随后，我们使用派生的目标函数来训练自动编码器和代理策略。实验表明，与穆约科克环境中的最先进方法相比，我们的AEAIL表现优越。更重要的是，当专家演示嘈杂时，AEAIL表现出更好的鲁棒性。具体而言，我们的方法分别获得了$ 16.4 \％$ $和$ 47.2 \％$相对改进的总体，而最佳基线Fairl和PWIL分别在清洁和嘈杂的专家数据上。视频结果，开源代码和数据集可在https://sites.google.com/view/auto-encoding-imitation中找到。

translated by 谷歌翻译

Heterogeneous Face Recognition via Face Synthesis with Identity-Attribute Disentanglement

Ziming Yang , Jian Liang , Chaoyou Fu , Mandi Luo , Xiao-Yu Zhang

分类：计算机视觉 | 人工智能

2022-06-10

异质的面部识别（HFR）旨在匹配不同域（例如，可见到近红外图像）的面孔，该面孔已被广泛应用于身份验证和取证方案。但是，HFR是一个具有挑战性的问题，因为跨域差异很大，异质数据对有限和面部属性变化很大。为了应对这些挑战，我们从异质数据增强的角度提出了一种新的HFR方法，该方法称为面部合成，具有身份 - 属性分解（FSIAD）。首先，身份属性分解（IAD）将图像截取到与身份相关的表示和与身份无关的表示（称为属性）中，然后降低身份和属性之间的相关性。其次，我们设计了一个面部合成模块（FSM），以生成大量具有分离的身份和属性的随机组合的图像，以丰富合成图像的属性多样性。原始图像和合成图像均被用于训练HFR网络，以应对挑战并提高HFR的性能。在五个HFR数据库上进行的广泛实验验证了FSIAD的性能比以前的HFR方法更高。特别是，FSIAD以vr@far = 0.01%在LAMP-HQ上获得了4.8％的改善，这是迄今为止最大的HFR数据库。

translated by 谷歌翻译

Wavelet Regularization Benefits Adversarial Training

Jun Yan , Huilin Yin , Xiaoyang Deng , Ziming Zhao , Wancheng Ge , Hao Zhang , Gerhard Rigoll

分类：计算机视觉

2022-06-08

对抗训练方法是针对对抗性例子的最先进（SOTA）经验防御方法。事实证明，许多正则化方法与对抗训练的组合有效。然而，这种正则化方法是在时域中实现的。由于对抗性脆弱性可以被视为一种高频现象，因此必须调节频域中的对抗训练的神经网络模型。面对这些挑战，我们对小波的正则化属性进行了理论分析，可以增强对抗性训练。我们提出了一种基于HAAR小波分解的小波正则化方法，该方法称为小波平均池。该小波正则化模块集成到宽的残留神经网络中，因此形成了新的WideWavelEtResnet模型。在CIFAR-10和CIFAR-100的数据集上，我们提出的对抗小波训练方法在不同类型的攻击下实现了相当大的鲁棒性。它验证了以下假设：我们的小波正则化方法可以增强对抗性的鲁棒性，尤其是在深宽的神经网络中。实施了频率原理（F原理）和解释性的可视化实验，以显示我们方法的有效性。提出了基于不同小波碱函数的详细比较。该代码可在存储库中获得：\ url {https://github.com/momo1986/AdversarialWavelTraining}。

translated by 谷歌翻译